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摘 要 : 频繁 的 旱灾 对 甘肃 省 经 济 、 农 业 生 产 造成 严重 危害 ,因此 利用 先进 方法 建立 准确 可 靠 的 农业 干旱 监测 模 
型 对 该 省 防 早 减灾 十 分 重要 。 本 文 基于 随机 森林 (RF) 、BP 神 经 网 络 和 支持 向 量 机 (SYM)3 种 机 器 学 习 方 法 ,利用 
甘肃 省 2002 一 2019 年 4 一 10 月 多 源 遥 感 数据 得 到 的 植被 状态 指数 (VCI) ,温度 状态 指数 (TCI) 、 植 被 供水 指数 


(VSWI) .降水 状态 指数 (PCI) 以 及 DEM .土壤 有 效 含水 量 (AWC) 和 气候 类 型 作为 自 变量 ,气象 站 点 以 3 个 月 时 间 尺 


度 的 标准 化 降水 蒸发 指数 (SPEI 3 ) 为 因 变 量 , 构 建 3 种 不 同 的 农业 干旱 监测 模型 ,分 析 比 较 出 适用 于 监测 甘肃 省 农 
业 干 旱 的 最 佳 模 型 ,同时 进一步 探究 了 机 器 学 习 方 法 构建 的 模型 在 不 同 环境 下 的 适用 性 。 结 果 表 明 : 构 建 的 3 种 机 
器 学 习 模 型 中 ,随机 森林 模型 的 尼 平 均值 高 (0.86) 且 误差 小 (RMSE 为 0.40,MAE 为 0.31) ,农业 干旱 的 监测 效果 要 
优 于 BP 神 经 网 络 和 支持 向 量 机 模型 ;干燥 和 湿润 两 种 环境 下 分 别 构建 的 3 种 机 器 学 习 模 型 在 湿润 环境 中 监测 能 


表现 均 更 优异 ( 尼 >0.82) ,而 随机 森林 模型 在 两 种 环境 中 监测 干旱 的 表现 比 其 他 两 种 模型 强 。 研 究 结果 为 甘肃 省 的 


农业 干旱 监测 与 评估 提供 了 新 的 科学 方法 ,对 农业 干旱 研究 具有 重要 意义 。 
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干旱 是 出 现 频率 高 .持续 时 间 长 .波及 范围 广 
的 气象 灾害 之 一 。 农 业 干 旱 是 由 于 低 于 正常 降水 
或 高 于 平均 燕 发 和 燕 腾 作用 而 导致 的 土壤 水 分 亏 
BR) 频繁 的 农业 干旱 导致 经 济 损失 严重 ,因此 准 
确 且 实时 或 接近 实时 的 农业 干旱 监测 是 必 不 可 
少 的 。 

干旱 指数 是 监测 和 分 析 农 业 干 旱 的 重要 方 
法 。 近 年 来 ,学 者 们 建立 了 各 种 干旱 指数 来 量化 干 
旱 特 征 , 特 别 是 严重 程度 和 空间 范围 ”。 根 据 数据 
源 不 同 , 通 常 分 为 基于 气象 站 点 数据 监测 的 干旱 指 
数 和 基于 遥感 数据 监测 的 干旱 指数 两 大 类 。 常 用 
的 基于 气象 站 点 数据 的 干旱 指数 包括 帕 默 尔 旱 度 指 
数 (PDSUD ”作物 干旱 识别 指数 ”综合 指数 (CD)”、 
KK 指数 ”标准 化 降水 指数 (SPI)* 和 标准 化 降水 落 
发 指数 (SPEI)”" 等。SPEI 由 于 同时 考虑 了 降水 量 
和 温度 并 且 能 够 监测 不 同 地 区 不 同类 型 的 干旱 ,被 
广泛 应 用 。 虽 然 基于 气象 站 点 数据 的 干旱 指数 能 
够 准确 且 有 效 的 监测 气象 站 及 其 周边 干旱 的 严重 
程度 ,但 在 可 用 气象 站 点 有 限 的 条 件 下 ,遥感 数据 
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$s i TD A) .空间 分 辩 率 高 .时效 性 强 等 特点 ,基于 
遥感 数据 的 干旱 指数 在 大 面积 干旱 时 空 模式 的 监 
测 中 更 为 可 靠 。 当 前 基于 遥感 数据 监测 的 干旱 指 
数 主要 有 归 一 化 植被 指数 (NDVI)5 植被 状态 指数 
(VCD 温度 状态 指数 (TCD 、 归 一 化 多 波段 二 
旱 指 数 (NMDI) 、 归 一 化 差 值 水 分 指数 (NDWI)'” 
以 及 植被 供水 指数 (VSWI)" 等。 最 初 多 是 单一 因 
素 的 遥感 指数 被 用 于 监测 和 分 析 干 量 , 如 NDVI、 
VCI 等 ,但 农业 干旱 过 程 复杂 多 变 , 影 响 因 素 众多 ， 
单一 因素 的 干旱 指数 往往 难以 反映 干旱 的 多 类 型 
和 多 尺度 特征 "。 因 此 利用 先进 方法 集成 多 源 数 
据 构建 综合 的 干旱 监测 模型 或 指数 逐渐 成 为 发 展 
新 趋势 。 

综合 多 源 数 据 的 干旱 监测 模型 或 指数 从 构建 
方法 角度 介绍 ,有 权重 组 合 .多 变量 联合 分 布 及 机 
器 学 习 方法 。Zhang 等 中 对 土壤 水 分 条 件 指 数 
(SMCI) TCI, PCL 进行 线性 加 权 构 建 微波 集成 干旱 
K% (MIDI) ,结果 表明 MIDI 与 实测 值 在 空间 分 布 
上 有 很 好 的 一 致 。 杜 瑞 麒 等 ”通过 联合 分 布 函数 
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构建 出 反映 土壤 水 分 和 降水 信息 的 综合 干旱 指数 ， 
并 较 好 的 分 析 了 吉林 省 的 干旱 时 空 特征 。 虽 然 权 
重组 合 与 联合 分 布 方法 在 干旱 监测 中 均 有 较 好 的 
表现 ,但 均 存 在 一 定 程度 的 缺陷 。 权 重组 合 方法 建 
立 的 综合 干旱 指数 需要 先 假设 变量 间 的 线性 关系 
然后 根据 专家 经 验 判 断 或 相关 分 析 等 方法 来 确定 
多 种 单一 干旱 指标 的 权重 ,而 农业 干旱 的 复杂 决定 
影响 因子 间 不 一 定 都 是 线性 关系 ,同时 权重 的 分 
配 也 存在 误差 ;利用 联合 分 布 方法 构建 的 综合 干旱 
各 数 虽 然 既 保留 了 单一 指标 本 身 的 边际 分 布 ,又 拉 
述 了 指标 之 间 复 杂 的 依存 关系 ,但 在 单一 指标 数量 
较 多 的 情况 下 ,变量 间 的 关系 变 得 复杂 时 ,会 导致 
建 模 变 得 困难 。 近 年 机 器 学 习 方法 逐渐 成 为 干旱 
人 研究 领域 的 新 秀 , 因 为 其 不 仅 能 够 处 理 干旱 影响 
子 间 复 杂 的 非 线性 问题 且 能 够 简单 明了 的 集成 多 
源 数 据 ,科学 高 效 的 建立 综合 干旱 监测 模型 ,合理 
的 解决 了 上 述 问 题 。 但 是 不 同 机 带 学 习 方 法 构建 
的 模型 在 农业 干旱 监测 上 具有 区 域 差异 性 ,而 且 甘 
肃 省 气候 类 型 复杂 ,干旱 频 发 。 为 了 能 在 甘肃 省 建 
立 更 加 全 面 精准 的 综合 农业 干旱 监测 模型 ,本 文采 
用 随机 森林 、BP 神 经 网 络 、 支 持 向 量 机 3 种 机 带 学 
习 法 ,考虑 多 种 干旱 因子 ,结合 气象 数据 和 多 源 遥 
感 数据 ,比较 分 析 构 建 的 3 种 综合 干旱 监测 模型 在 
甘肃 省 的 适用 性 ,同时 探究 模型 在 不 同 环境 下 的 表 
现 并 分 析 不 同 致 旱 因 子 的 相对 重要 性 ,为 农业 干旱 
监测 研究 提供 了 新 方法 以 及 科学 参考 。 


1 数据 与 方法 


1.1 研究 区 概况 

甘肃 省 位 于 中 国 西北 部 ,地 理 位 置 为 32"11'~ 
42°57'N ,92*13'~108"46 下 。 甘 肃 是 典型 的 温带 大 陆 
性 气候 ,降水 少 蒸发 大 。 在 甘肃 几乎 每 年 都 发 生 农 
业 干 旱 , 每 年 平均 受灾 面积 达到 82.68x10* kim? ,并 导 
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致 5x10;~10x10 kg 的 粮食 减产 P 。 
1.2 数据 处 理 

本 文 从 气象 .土壤 .植被 方面 进行 因子 选择 , 选 
取 PCI 和 TCI 为 气象 因子 ,VSWI 作 为 土壤 因子 ,VCI 
是 植被 因子 。 考 虑 到 研究 区 内 不 同 地 形 水 分 、 温 
E .植被 覆盖 度 等 因素 在 空间 上 存在 差异 性 ,土壤 
的 生产 力 和 抗旱 性 在 空间 上 有 高 度 变异 性 以 及 研 
究 区 内 气候 类 型 复杂 等 原因 ,选择 数字 高 程 模型 
DEM .土壤 有 效 含 水 量 以 及 中 国 气候 区 划 为 模型 的 
辅助 因子 。 

数据 选择 的 时 间 范 围 为 2002 一 2019 年 ,时 间 分 
辩 率 为 月 (4 一 10 月 ) ,空间 分 辩 率 为 1 km H, 
MODIS 数 据 有 MOD11A2 产 品 中 的 地 表 温 度 (LST)， 
时 间 分 辩 率 为 8 d, 空 间 分 辨 率 为 1 km, 月 数据 为 4 
幅 影像 数据 求 平 均 ;MOD13A2 产 品 中 的 归 一 化 植被 
指数 和 增强 型 植被 指数 (EVT) ,时 间 分 辩 率 为 16 d, 
空间 分 辩 率 为 1 km。 降 雨 数据 选择 TRMM3B43, 时 
间 分 辨 率 为 月 ,空间 分 辨 率 为 0.25°*。 以 上 MODIS 
和 TRMM 数据 均 来 自 于 NASA (https://ladsweb. 
modaps.eosdis.nasa.gov/) ,在 数据 处 理 过 程 中 ,对 于 
TRMM 数据 首先 将 降水 速率 转换 为 月 降水 总 量 数 
据 , 然 后 统一 对 NDVI LST EVI LA & TRMM 数据 进 
行 裁剪 ,投影 转换 ,采用 最 邻近 法 进行 重 采 样 使 空 
间 分 辩 率 为 1 km, 最 后 通过 以 上 数据 计算 出 VCI、 
TCI、PCI、VSWI 指 数 ,具体 计算 过 程 如 表 1。 

DEM 数字 高 程 .中 国 气候 区 划 和 中 国土 壤 砂 、 
茜 粒 含量 数据 以 及 用 于 制图 的 土地 覆盖 类 型 数据 
均 来 源 于 中 国 科学 院 资 源 环境 科学 数据 中 心 (https: 
/Iwww.resde.en/) ,空间 分 辨 率 均 为 1 kmo ERAZ 
含水 量 利用 Gupta 等 "提出 的 土壤 砂 、 医 粒 合 量 的 
经 验 线性 拟 合 模型 估算 。 对 全 国 DEM 气候 区 划 以 
及 土壤 有 效 售 水 量 进行 裁剪 .投影 转换 后 可 直接 
使 用 。 

气象 数据 来 源 于 中 国 气象 数据 网 (http://data. 


表 1 干旱 指数 计算 方法 


Tab.1 Remote sensing drought index calculation formula 


干旱 指数 公式 文献 来 源 
VCI 植 被 状态 指数 (NDVI, -= NDVI,,,)(NDVI,,.. = NDVI...) [22] 
TCI 温 度 状 态 指 数 EST -LST)MCLST 7 LST nin) [22] 
PCI 降 水 指数 (TRMM, - TRMM,,,)/(TRMM,,,, - TRMM,,,) [22] 
VSWI 植 被 供水 指数 EVI/LST [23] 


注 :i 为 第 i 月 的 NDVILST、TRMM 值 (i=4,5,6,…,10),max 与 min 分 别 为 2002 一 2019 年 第 i 月 的 最 大 值 与 最 小 值 。 
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ema.cn/) ,气象 站 点 分 布 如 图 1 所 示 , 根 据 研究 区 和 气 预测 结果 由 所 有 决策 树 结 果 的 平均 值 决定 。 


象 数据 的 缺失 和 站 点 分 布 在 耕地 的 情况 ,最 终 选 择 
25 个 气象 站 点 。 站 点 数据 主要 包括 1970—2019 年 
的 月 平均 气温 和 月 降水 量 ,用 于 计算 1 个 月 .3 个 月 、 


13.2 BP 神经 网 络 BP 神经 网 络 是 一 种 由 输入 层 、 
eas eg 并 由 误差 逆 传 播 方法 训练 的 多 
层 前 馈 网 络 下 。 主 要 包括 前 向 传播 和 误差 的 反 向 


6 个 月 时 间 尺 度 的 SPEI。 传播 。 前 向 传播 指 在 计算 误差 输出 时 ,输入 信号 通 
过 隐 含 层 作 用 于 输出 节点 ,经 过 非 线性 变换 ,产生 
输出 信号 ,如 果实 际 输出 与 期 望 输 出 不 相符 , 则 转 
入 误差 的 反 向 传播 过 程 。 误 差 反 向 传播 指 输出 误 
差 的 逆向 逐 层 分 推 和 调节 闽 值 使 误差 阶梯 下 降 的 
1.3.3 支持 向 量 机 ”支持 向 量 机 是 一 种 监督 学 习 方 
法 ,通过 非 线 性 映射 ,采用 a 将 


95°E 
T 


100°E 105°E 
T T 


40°N 
40°N 


低 维 空间 和 线性 不 可 分 的 数据 映射 到 高 维 空间 使 
= 其 成 为 线性 可 分 的 ,再 将 数据 在 高 维 空 sieves 
i 和 预测 9H。 支持 向 量 机 的 核心 是 核 函 数 ,可 以 提高 
算法 的 速度 。 
95°E 100°E 105E 2 结 果 与 分 析 


图 1 研究 区 概况 
Fig. 1 Overview of the study area 


21 干旱 因子 分 析 
降水 .土壤 、 植 被 干旱 因子 在 不 同时 期 对 干旱 
的 表现 不 同 。 提 取 2002 一 2019 年 甘肃 4 一 10 月 所 


1.3 研究 方法 
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1.3.1 随机 森林 随机 森林 的 核心 思想 是 回归 和 分 
类 ,是 使 用 去 相关 树 有 效 地 减少 预测 变量 方差 的 一 
种 方法 中 。 随 机 森林 方法 的 具体 步骤 为 :首先 从 训 
练 数据 中 ,通过 随机 提取 训练 数据 集中 的 部 分 数 
据 , 比 如 20% 的 数据 集 , 并 据 此 形成 决策 树 ;然后 将 
提取 的 20% 的 数据 集 放 回 训练 集中 ,并 再 次 随机 提 
取 20% 的 数据 集 ,产生 第 二 个 决策 树 。 不 断 重复 第 
THE ,建立 多 个 决策 树 并 以 此 组 成 随机 森林 ;最 终 


有 气象 站 点 的 VCI、TCI、PCI 和 VSWI 指 数 , 按 月 依 
次 对 4 种 遥感 指数 和 1 个 月 .3 个 月 .6 个 月 时 间 尺 度 
的 SPEI( 分 别 由 SPEI_ 1,SPFI 3 和 SPEI 6 表示 ) JE 
行 Pearson 相关 性 分 析 ,进而 分 析 单 个 遥感 干旱 指数 
监测 农业 干旱 的 能 力 以 及 融合 多 源 数据 的 必要 性 ， 
结果 如 表 2 所 示 。3 种 时 间 尺 度 的 SPEI 除 了 植被 状 
态 指数 VCI 在 植被 生长 初期 和 末期 外 ,其 他 指数 的 
相关 性 均 通 过 了 0.01 或 0.05 显著 性 检验 。 


表 2 遥感 指数 与 不 同时 间 尺 度 SPEI 的 相关 性 分 析 

Tab. 2 Correlation analysis between remote sensing index and SPEI on different time scales 

AM SPEL_1 SPEL3 SPEI_6 
VCI TCI PCI VSWI VCI TCI PCI VSWI VCI TCI PCI VSWI 
4 0.06 0.38" 0.54" 0.30° 0.09 0.23” 0.47” 0.34" 0.09 0.28” 0.56” 0.30” 
3 0.09 0.28" 0.61” 0.29* 0.07 0.24” 0.60” 0.26” 0.08 0.29” 0.53” 0.21” 
6 0.12” 0.35 0.65” 0.34” 0.10” 0.34” 0.51” 0.30° 0.21 0.33” 0.53” 0.25* 
7 0.15” 0.34 0.76” 0.40* 0.28” 025" 0.68” 0.29” 0.19° 0.32” 0.78” 0.32° 
8 0.16” 0.24” 0.78” 0.27” 0.17" 0.27” 0.65” 0.28” 0.20” 0.25" 0.62” 0.23” 
9 —0.02 0.31" 0.49* 0.24” 0.04 0.23” 0.45 0.29" 0.02 0.26" 0.43° 0.26” 
10 0.11 0.32” 0.55” 0.37” 0.25° 0.27” 0.50” 0.41” 0.17” 0.30” 0.56” 0.32° 

注 :*# 表 示 在 0.01 水 平 上 显著 相关 ,* 表 示 在 0.05 水 平 上 显著 相关 。VCI 表 示 植 被 状态 指数 ,TCI 表 示 温 度 状 态 指数 ,PCI 表 示 降 水 状态 指数 ， 


VSWI 表 示 植 被 供水 指数 。 
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对 于 降水 指数 PCI, 其 相关 性 在 3 种 时 间 尺 度 的 
SPEIL 中 均 为 最 高 , 旦 在 7 月 达到 最 大 值 , 说 明 以 降水 
因子 建立 的 干旱 指数 在 降水 充足 的 季节 其 监测 结 
果 更 具有 参考 价值 。 温 度 干旱 指数 TCI 在 植被 生长 
初期 的 相关 系数 要 高 于 植被 生长 中 后 期 ,如 TCI 与 
不 同时 间 尺 度 SPEI 的 相关 性 均 在 6 月 达到 最 大 
值 。 在 4 一 10 月 ,植被 干旱 指数 VCI 与 不 同时 间 尺 
度 SPEI 的 相关 性 均 呈 现 先 增 大 后 减 小 的 过 程 , 以 
SPEL 3 为 例 , 在 4 月 和 5 月 未 通过 显著 性 检验 ,到 7 
月 植被 生长 最 佳 时 期 ,相关 系数 达到 最 大 ,8 月 开 
始 ,相关 性 又 逐渐 减弱 。 这 表明 以 植被 因子 建立 的 
干旱 指数 在 植被 覆盖 度 较 好 的 区 域 监测 干旱 能 
更 可 靠 。 在 月 时 间 尺 度 上 土壤 湿度 指数 VSWI 其 相 
关 性 表现 为 先 增 大 后 减 小 再 增 大 的 趋势 。 其 变化 
趋势 与 植被 指数 VCI 相 同 ,说 明 土 壤 湿 度 指 数 更 适 
合 于 植被 茂盛 区 域 的 旱情 监测 。 

以 上 分 析 表 明 ,PCI VCITCI 以 及 VSWI 单 个 遥 
感 干 旱 指 数 在 监测 农业 干旱 中 具有 局 限 性 ,虽然 
PCI 与 SPEI 的 相关 性 高 ,但 单一 降水 因素 不 能 代表 
于 旱 。 因 此 应 用 先进 的 机 器 学 习 方法 来 融合 多 种 
致 旱 因子 ,构建 综合 监测 农业 干旱 的 模型 具有 重要 
意义 。 

不 同时 间 尺 度 的 标准 化 降水 蒸发 指数 SPFI 可 
以 分 析 不 同 的 干旱 类 型 ,1 一 6 个 月 时 间 尺 度 的 SPEI 
适用 于 气象 和 农业 干旱 , 较 长 时 间 尺 度 的 SPEI 适 用 
于 水 文 干旱 。 大 量 人 研究 表明 3 月 或 更 长 时 间 尺 度 的 
SPEI 更 能 代表 农业 干旱 ,本 文采 用 3 个 月 时 间 尺 度 
的 SPEI 分 析 农 业 干 旱 。 

2.2 模型 构建 及 验证 评价 

从 2012—2019 年 甘肃 气象 站 点 中 随机 选取 5 
组 不 同 的 5 个 站 点 作为 模型 的 验证 数据 ,其 次 ， 
2002 一 2019 年 除 每 组 被 选 出 的 5 个 验证 站 点 外 所 有 
站 点 的 SPEL3 和 所 在 站 点 的 VCI、TCI、PCI、VSWI.、 
DEM AWC 和 气候 类 型 作为 模型 的 训练 数据 。 每 组 
训练 样本 数据 依次 有 461 个 、462 个 、465 个 、465 个 
和 465 个 。 运 用 3 种 机 器 学 习 方 法 分 别 对 4 一 10 月 
的 训练 样本 进行 学 习 , 每 月 包括 5 组 不 同 的 训练 样 
本 , 共 构 建 35 组 农业 干旱 监测 模型 。 

模型 构建 中 随机 森林 有 两 个 重要 参数 ,决策 树 
个 数 n 和 树 节 点 预选 变量 个 数 m; 当 nn 太 小 则 模型 欠 
WE, Mn 足够 大 时 模型 逐渐 趋 于 稳定 。n 应 大 于 
100,m 的 取 值 公式 为 VP ,其 中 PP 为 候选 特征 变量 ， 
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m 应 小 于 特征 变量 。 为 了 选取 误差 最 小 的 m, 根 据 
经 验 公 式 和 不 小 于 特征 变量 两 个 要 求 , 逐 一 选择 m 
并 构建 不 同 的 回归 模型 。 以 4 月 的 5 组 模型 为 例 ， 
当 n=1000,m 依 次 取 2、3、2、2、2 时 ,随机 森林 模型 的 
误差 最 小 ,同样 方法 得 到 其 余 30 个 模型 的 参数 。 支 
持 向 量 机 方法 构建 模型 时 选取 误差 较 小 、 分 类 准确 
率 较 高 的 径 向 基 函 数 RBF, 两 个 重要 参数 为 核 参数 
g 和 惩罚 系数 C。 核 参数 g 影 响 训 练 和 预测 速度 。 
惩罚 系数 C 越 大 ,模型 容易 过 拟 合 , 过 小 容易 欠 拟 
合 。 经 过 反复 试验 , 当 支 持 向 量 机 的 g 为 0.02 、 惩 
罚 系数 C 为 10 时 模型 是 最 稳定 的 。BP 神 经 网 络 
中 梯度 下 降 法 是 调整 全 局 权重 和 阅 值 的 关键 ,本 
文选 择 训 练 速度 最 快 的 trainlm 函数 ,缺点 是 需要 
的 内 存 大 。 

通过 模型 输出 的 模拟 值 与 SPEI_3 实测 值 之 间 
的 相关 性 分 析 , 验 证 评价 机 器 学 习 方 法 构建 的 农业 
干旱 监测 模型 。 图 2 为 3 种 机 器 学 习 方法 各 月 份 第 
2 组 验证 样本 模拟 值 与 实测 值 SPEL_3 的 散 点 图 ,图 
中 随机 森林 、BP 神 经 网 络 和 支持 向 量 机 模型 的 模拟 
值 分 别 用 RF_nh、BP_nh 和 SVM_nh 表 示 。 由 图 2 可 
以 看 出 ,4 一 10 月 份 3 种 机 器 学 方法 模型 的 模拟 值 与 
SPEL 3 实测 值 的 相关 系数 都 不 小 于 0.89 ,说明 3 种 
机 器 学 习 方 法 构建 的 农业 干旱 监测 模型 都 可 应 用 
于 实际 的 旱情 监测 。 
2.3 3 种 机 器 学 习 方 法 监测 结果 对 比 

利用 决定 系数 记 、 均 方 根 误差 RMSE 和 平均 绝 
对 误差 MAE 来 比较 模型 模拟 结果 进而 分 析 适 用 于 
甘肃 省 构建 模型 的 最 佳 机 器 学 习 方 法 。 从 3 种 机 器 
学 习 方法 对 验证 数据 的 预测 结果 统计 可 知 ( 表 3)， 
在 随机 森林 构建 的 35 个 监测 模型 中 ,随机 森林 模型 
模拟 值 与 SPEL 3 实测 值 的 尼 在 0.78~0.95 ,4 一 10 月 
的 总 平均 值 为 0.86;BP 神 经 网 络 模型 的 尼 在 0.70~ 
0.91 ,4 一 10 月 的 总 平均 值 为 0.82; 文 持 向 量 机 模型 
的 尼 在 0.73~0.91,4 一 10 月 的 总 平均 值 为 0.84; 同时 
也 对 每 月 5 组 模型 的 统计 指标 进行 求 平均 值 ,发 现 
随机 森林 模型 的 尺 要 高 于 BP 神经 网 络 和 支持 向 量 
机 ,说 明 随 机 森林 模型 模拟 的 结果 对 干旱 指数 
SPEL 3 的 解释 程度 更 高 。 随 机 森林 、BP 神 经 网 络 和 
支持 向 量 机 3 种 方法 构建 的 模型 中 ,RMSE 和 MAE 
的 最 大 值 分 别 是 0.79 和 0.66、1.00 和 0.79、0.81 和 
0.66, 说 明 与 BP 神经 网 络 和 支持 向 量 机 模型 相 比 ， 
随机 森林 模型 的 模拟 值 与 SPEL 3 实测 值 的 差异 更 


202201.00093v1 


chinaXiv 


326 干 时 


ChinaXiv 合 作 期 刊 


wt F 39 卷 


G 
名 
-3 -2 -21 0 12 
SPEI 3 SPEI 3 
3 (a5) 8H r=0.94 
Se 
1 
g 0 司 
外 -l 名 
=) 
3 
SPEI 3 SPEL 3 
(b1) 4 月 r=0.93 
G 
PL 
m 


SPEI_3 SPEL 3 


-3 -2 -1 0 1 2 


SPEL 3 SPEI 3 


(c5) 8 月 r=0.90 


SVM_nh 


SVM nh 


-3 -2 -1 0 1 2 


SPEI 3 


2, (b4) 7 月 r=0.92 


BP nh 


SPEI 3 


(c4) 7 月 r=0.93 


SVM_nh 


图 2 模型 模拟 值 与 实测 值 SPEI 3 散 点 网 


Fig. 2 Scatter plot of model simulation value and measured value SPEI 3 


小 ,表现 最 好 ,而 支持 向 量 机 模型 的 表现 则 要 优 于 
BP 神 经 网 络 模型 。 通 过 上 述 分 析 表 明 ,随机 森林 方 
法 构建 的 模型 在 甘肃 省 的 农业 干旱 监测 中 表现 
更 佳 。 
2.4 机 器 学 习 空间 敏感 性 分 析 

甘肃 气候 类 型 复杂 ,随机 森林 、BP 神 经 网 络 和 
支持 向 量 机 构建 的 3 种 模型 受 不 同 气 候 模式 的 影 
响 , 对 干燥 和 潮湿 地 区 干旱 指数 SPEI_3 的 模拟 可 能 
不 同 ,利用 K 均 值 聚 类 方法 根据 多 年 降水 条 件 将 气 


象 站 点 划分 为 干燥 和 湿润 两 种 类 型 ( 表 4)。 首 先 根 
据 两 个 聚 类 将 原始 数据 分 为 聚 类 1 干燥 ) 与 聚 类 2 
(湿润 ) 的 训练 样本 和 验证 样本 ,然后 分 别 训 练 BP 神 
经 网 络 .随机 和 森林 和 支持 向 量 机 模型 ,最 后 利用 决 
ERARE . 均 方 根 误 差 RMSE 和 平均 绝对 误差 MAE 
来 评 佑 模型 的 性 能 ( 表 5)。 从 表 5 可 知 , 不 管 在 那 种 
环境 下 ,随机 森林 模型 的 表现 要 优 于 其 他 两 种 模 
型 ,在 干燥 的 环境 下 ,BP 神经 网 络 模型 的 性 能 比 支 
持 向 量 机 模型 好 ,湿润 环境 下 ,与 BP 神经 网 络 模 型 
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表 3 3 种 机 器 学 习 方 法 对 验证 数据 拟 合 结果 统计 


Tab.3 Statistics of the fitting results of the three machine learning methods on the verification data 


随机 森林 BP 神经 网 路 支持 向 量 机 
月 份 样本 

R RMSE MAE R RMSE MAE R RMSE MAE 

4 1 0.78 0.79 0.66 0.70 1.00 0.79 0.73 0.81 0.66 
2 0.91 0.43 0.29 0.86 0.45 0.32 0.83 0.50 0.37 

3 0.84 0.50 0.39 0.80 0.58 0.42 0.85 0.49 0.39 

4 0.86 0.56 0.42 0.82 0.53 0.39 0.85 0.49 0.39 

5 0.90 0.36 0.31 0.87 0.40 0.32 0.87 0.37 0.31 

平均 值 0.86 0.53 0.41 0.81 0.59 0.45 0.82 0.53 0.42 

5 1 0.84 0.56 0.40 0.80 0.68 0.53 0.82 0.58 0.40 
2 0.95 0.33 0.23 0.91 0.34 0.24 0.91 0.35 0.24 

3 0.85 0.37 0.28 0.81 0.44 0.31 0.84 0.42 0.30 

4 0.88 0.36 0.28 0.81 0.47 0.37 0.84 0.38 0.27 

5 0.82 0.37 0.31 0.77 0.41 0.33 0.78 0.41 0.31 

平均 值 0.87 0.40 0.30 0.82 0.47 0.36 0.84 0.43 0.30 

6 1 0.80 0.38 0.29 0.77 0.39 0.30 0.76 0.40 0.32 
2 0.91 0.24 0.18 0.87 0.29 0.22 0.91 0.25 0.19 

3 0.87 0.23 0.18 0.85 0.35 0.28 0.85 0.27 0.22 

4 0.85 0.31 0.26 0.82 0.29 0.23 0.82 0.38 0.32 

5 0.82 0.36 0.29 0.82 0.35 0.27 0.79 0.35 0.28 

平均 值 0.85 0.30 0.24 0.83 0.33 0.26 0.83 0.33 0.26 

7 1 0.86 0.36 0.26 0.84 0.39 0.30 0.82 0.51 0.39 
2 0.90 0.38 0.27 0.85 0.41 0.31 0.87 0.39 0.29 

3 0.81 0.42 0.32 0.78 0.43 0.34 0.81 0.41 0.35 

4 0.85 0.51 0.37 0.80 0.48 0.36 0.81 0.48 0.40 

0.88 0.36 0.28 0.83 0.42 0.33 0.85 0.41 0.33 

平均 值 0.86 0.41 0.30 0.82 0.43 0.33 0.83 0.44 0.35 

8 1 0.85 0.49 0.39 0.81 0.52 0.40 0.83 0.50 0.45 
2 0.88 0.40 0.29 0.80 0.47 0.35 0.81 0.48 0.38 

3 0.90 0.34 0.29 0.87 0.38 0.31 0.88 0.36 0.29 

4 0.87 0.40 0.36 0.85 0.45 0.36 0.83 0.50 0.41 

5 0.89 0.39 0.29 0.82 0.48 0.39 0.86 0.43 0.29 

平均 值 0.88 0.40 0.32 0.83 0.46 0.36 0.84 0.45 0.36 

9 1 0.85 0.44 0.33 0.82 0.48 0.35 0.80 0.53 0.41 
2 0.84 0.45 0.34 0.80 0.46 0.31 0.82 0.46 0.33 

3 0.89 0.32 0.23 0.87 0.35 0.26 0.90 0.32 0.21 

4 0.89 0.34 0.28 0.82 0.43 0.32 0.86 0.42 0.31 

5 0.83 0.44 0.32 0.81 0.46 0.36 0.80 0.50 0.38 

平均 值 0.86 0.40 0.30 0.82 0.44 0.32 0.84 0.45 0.33 

10 1 0.84 0.44 0.32 0.76 0.54 0.44 0.83 0.46 0.35 
2 0.90 0.39 0.28 0.83 0.46 0.34 0.86 0.42 0.32 

3 0.87 0.36 0.30 0.83 0.49 0.38 0.85 0.37 0.28 

4 0.89 0.36 0.29 0.85 0.39 0.31 0.87 0.41 0.32 

5 0.86 0.37 0.26 0.82 0.42 0.33 0.84 0.41 0.31 


平均 值 0.87 0.38 0.29 0.82 0.46 0.36 0.85 0.41 0.32 
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#4 站 点 聚 类 结果 
Tab.4 Site classification 
分 类 站 点 年 平均 降水 量 /mm ”平均 温度 /人 C 
RŽI FR KR AR RI A ACA RE RA ,高台 BE J ETA UA 155.93 7.97 
RE 2 Fell ,临夏 ATA ME FEL De RE RAR EIR ERIE .会 宁 、 天 水 483.96 8.60 
表 5 不 同 空间 模型 性 能 评估 
Tab. 5 Model performance evaluation in different spaces 
分 类 BP 神 经 网 络 随机 森林 支持 向 量 机 
R RMSE MAE R RMSE MAE R RMSE MAE 
聚 类 1( 干 燥 ) 0.81 0.38 0.29 0.83 0.37 0.27 0.78 0.43 0.34 
聚 类 2( 湿 润 ) 0.82 0.48 0.38 0.88 0.45 0.34 0.85 0.45 0.36 
相 比 支持 向 量 机 模型 表现 更 佳 。 此 外 ,3 种 机 顺 学 ”监测 能 力 更 好 。 
习 方 法 构建 的 模型 在 湿润 环境 下 监测 农业 干旱 的 o 
能 力 优 于 干燥 环境 下 。 3 讨论 


为 了 确定 不 同 环境 下 模型 在 连续 时 间 序 列 上 
对 SPFI 3 实测 值 模 拟 的 性 能 。 选 择 聚 类 1 和 聚 类 2 
两 组 验证 样本 中 共 12 个 站 点 ,验证 3 种 机 咒 学 习 方 
法 的 时 空 差异 性 。 图 3 为 3 种 机 器 学 习 方 法 对 
2012 一 2019 年 7 月 的 12 个 气象 站 点 模拟 值 与 实测 
SPEI 3 的 一 致 性 分 析 , 其 中 山 丹 、 景 秦 、 张 掖 .永昌 、 
A PE A Ha IE 
县 .临夏 CAB AUR A EA E3 
可 知 ,连续 时 间 序 列 上 REF 模型 在 两 个 聚 类 中 模拟 
SPEI 3 实测 值 的 表现 最 好 。 在 干燥 环境 的 站 点 中 
除 张 掖 和 高 台 站 点 外 其 他 站 点 BP 模 型 表现 比 支持 
向 量 机 模型 好 ,在 湿润 环境 的 站 点 中 支持 向 量 机 模 
型 略 好 ,分 析 结 果 与 表 5 相似 ,说 明 不 同 环境 下 构建 
的 模型 是 可 靠 的 。 

随机 森林 方法 可 以 进行 变量 重要 性 排序 ,因此 
通过 该 法 获取 两 个 聚 类 王 旱 因子 (VCITCI PCI, 
VSWI、AWC 气候 类 型 和 DEM) 的 重要 性 排序 (图 
4)。 气 象 因 子 PCI 与 TCI 在 干燥 和 湿润 环境 中 排名 
均 为 前 两 名 ,对 整个 模型 的 影响 最 大 ,这 两 个 气象 
因子 的 总 和 分 别 占 聚 类 1 和 聚 类 2 相对 重要 性 的 
56% 和 55% ,表明 降水 和 温度 因子 是 造成 农业 干旱 
的 主要 因素 。 在 聚 类 2 湿润 环境 中 ,土壤 因子 VSWI 
重要 性 为 第 3, 植 被 因子 VCI 为 第 4。 聚 类 1 干燥 环 
境 中 ,植被 为 第 3 ,土壤 因子 为 第 4。 但 受 环境 的 影 
响 ,湿润 环境 下 的 植被 长 势 比 干燥 环境 下 好 。 机 器 
学 习 构 建 的 模型 在 降水 较 多 、 植 被 覆盖 度 高 的 区 域 


干旱 是 影响 人 类 生活 生产 的 自然 灾害 之 一 , 精 
准 实时 的 监测 农业 干旱 是 必须 要 解决 的 问题 , 故 本 
文 融 合 气象 数据 和 遥感 数据 ,利用 随机 森林 、 文 持 
向 量 机 和 了 BP 神 经 网 络 3 种 机 器 学 习 方法 ,构建 了 3 
种 甘肃 省 综合 农业 干旱 监测 模型 。 已 有 研究 表明 
2 ,机 器 学 习 模 型 可 以 有 效 的 提高 监测 干旱 的 准确 
性 ,这 与 本 文 的 研究 是 一 致 的 。 本 文 对 模型 模拟 的 
结果 与 实测 值 SPEL 3 进行 比较 分 析 ,两 者 有 很 好 的 
一 致 性 ,同时 对 4 种 单 因子 干旱 指数 与 3 种 不 同时 
间 尺 度 的 SPEI 进 行 了 相关 性 分 析 ,模型 的 相关 性 高 
于 单 因子 相关 性 ,表明 融合 多 源 遥 感 数据 确实 提高 
了 遥感 监测 农业 干旱 的 准确 性 。 

3 种 模型 中 ,随机 森林 模型 的 模拟 结果 要 优 于 
支持 向 量 机 和 了 BP 神 经 网 络 模型 ,让 更 大 ,误差 更 
小 。 这 一 结果 与 董 婷 等 ”的 研究 一 致 ,随机 森林 模 
型 在 干旱 监测 中 表现 更 优 ,更 具有 普 适 性 。 本 研究 
中 3 种 机 器 学 习 模 型 在 湿润 环境 的 表现 更 好 ,而 在 
两 种 环境 中 随机 森林 模型 的 监测 能 力 仍 强 于 文 持 
向 量 机 和 了 BP 神 经 网 络 模型 ,这 与 Feng 等 ”的 研究 
结果 是 相似 的 ,明确 了 本 文 研究 的 准确 性 和 可 靠 
性 ,同时 也 进一步 表明 了 随机 森林 模型 在 农业 干旱 
监测 中 更 有 潜力 。 但 本 文 依然 存在 需要 改进 的 地 
方 ,本 文 使 用 的 降水 遥感 数据 空间 分 辨 率 为 0.25°， 
时 间 分 辩 率 为 月 ,都 有 待 进一步 提高 。 本 文 在 干旱 
因子 选择 时 没有 考虑 蒸发 、 人 类 活动 等 因素 。 未 来 
需要 针对 这 些 不 足 进一步 进行 研究 。 
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注 :al~ 生 为 干燥 环境 中 的 气象 站 点 ,a2~ 介 为 湿润 环境 中 的 气象 站 点 。 
图 3 2012 一 2019 年 7 月 模型 模拟 值 与 实测 SPEI 3 的 变化 趋势 
Fig. 3 The change trend of model simulation value and measured SPEI 3 from 2012 to July 2019 
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图 4 不 同 聚 类 因子 重要 性 分 析 


Fig. 4 Analysis of the importance of different clustering factors 
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通过 采用 随机 和 森林、 支持 向 量 机 和 BP 神经 网 络 
3 种 机 融 学 习 方法 ,集成 多 源 数据 ,构建 了 3 种 甘肃 
省 综合 农业 干旱 监测 模型 ,并 验证 了 3 种 机 器 学 习 
模型 的 精度 ,比较 了 3 种 机 器 学 习 模型 在 甘肃 省 农 
业 干 旱 监 测 的 结果 以 及 在 不 同 环境 下 模型 的 表 
现 。 主 要 得 出 结论 如 下 : 

(1) 3 种 机 顺 学 习 方 法 构建 的 综合 农业 干旱 监 
测 模 型 的 模拟 值 与 SPEIL 3 实测 值 的 相关 系数 均 在 
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0.89 以 上 ， 表明 构建 的 3 种 模型 是 有 效 的 , 均 可 应 用 drought index in the spring drought analysis in Northwest China 
于 甘肃 省 的 农业 干旱 监测 [J]. Journal of Natural Resources, 2007, 22(5): 709-717. ] 
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朱 进 行 了 比较 发 现 随机 森林 方法 构建 的 模型 统计 2019, 30(6): 59-67. [Lin Hui, Wang Jingcai, Huang Jinbai, et al. 

BE 5 A oy Eb by sts 、 LE yy 
指 标 要 优 于 文 持 向 量 机 模型 和 BP 神经 网 络 模型 ’ 说 Comparative study on spatial and temporal distribution character- 
明 RE 模型 能 更 全 面 可 靠 精 YE 的 对 甘肃 省 的 农业 干 istics of meteorological drought in the upper and middle reaches of 
旱 进 行 监测 Huai river basin based on SPI and SPEI[J]. Journal of Water Re- 
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英 型 性 能 森林 模型 在 干燥 和 湿润 环境 中 表现 
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Comparative agricultural drought monitoring based on three 


machine learning methods 


WANG Xiaoyan, LI Jing, XING Liting 


(College of Geography and Environmental Science, Northwest Normal University, Lanzhou 730070, Gansu, China) 


Abstract: Frequent droughts have caused serious harm to the economy and agricultural production of Gansu 
Province. Therefore, it is very important for the province to use advanced methods to establish accurate and 
reliable agricultural drought monitoring models. Three machine learning methods (random forest, BP neural 
network, support vector machine) are used to construct an agricultural drought monitoring model using remote 
sensing factors and meteorological factors. Analysis of the best model for agricultural drought monitoring in 
Gansu Province. At the same time, the applicability of the model constructed by machine learning in different 
environments was further explored. The results show that among the models constructed by the three machine 
learning methods, the RF model has a high coefficient of determination (0.86) and small errors (RMSE 0.40, 
MAE 0.31). The monitoring effect of agricultural drought is better than the model constructed by BP and SVM; 
The three machine learning method models constructed in the two environments, respectively, performed better in 
the wet environment, while the model constructed by the random forest method performed better than the other 
two models in monitoring drought in the two environments. The research results provide a new scientific method 
for agricultural drought monitoring and evaluation in Gansu Province, and are of great significance to agricultural 
drought research. 


Keywords: agricultural drought; machine learning; SPEI; MODIS 


